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PROCEDE DE RECONFIGURATION APPLICABLE A UN RESEAU 
ELEMENTS FONCTIONNELS IDENTIQUES 

DESCRIPTION 

5 

Domaine technique 
La presente — invention — ronu^nre — uA proc^S^ — 3^ 

reconfiguration applicable a un reseau d' elements 
. f onctionnels identiques . 
10 Le domaine de 1' invention est notamment celui 

des calculateurs paralleles formant un ensemble de 

processeurs interconnectes , en matrice, en anneau ou en 
hyp or cub e , — celui — des — correl a teur s — ID — cxu — 2JD-, des 

architectures de matrice de bloc de calculs de la 
15 transformee de Fourier rapide (FFT) . Deux exemples du 

premier type d' applications sont ainsi donnes dans le 

document reference [1] en fin de description. 



o 



Etat de la technique anterieure 

20 Les possibilites croissantes de la technologie 

micro-electronique, de meme que 1' evolution des 
architectures multiprocesseurs , conduisent a des 
calculateurs de plus en plus complexes tant en termes 
d' Elements qui les composent (portes electroniques , 

25 memoires, registres, processeurs ..,) , qu'en termes de 
complexite des logiciels utilises. 

Les concepteurs de tels calculateurs a 
structure parallele ou massivement parallele tres 
integree doivent prendre en compte deux exigences 

30 antagonistes : 

1- Des machines ^ structure parallele ou 
massivement parallele sont sujettes a des defauts dus 
au nombre tres important de processeurs et a la 
complexite de ceux-ci, ce qui induit un mauvais 
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rendement de fabrication et des fautes graves en 
f one t i onnement normal . 

2- Avec des technologies tres avancees et des 
systemes tres integres, de plus en plus de processeurs 
5 peuvent etre incorpores dans un circuit integre 
specif ique (en anglais ASIC ou « Application Specific 
Integrated Circuit ») , un module multipuce (en anglais 
MCM ou « Multichip Module ») ou une carte. Dans de tels 
systemes le principal inconvenient est celui d'une 

10 bande passante, c'est-a-dire une quantite 

d' informations que 1 ' on peut passer, limitee. ^ 
Pour repondre a la premiere de ces exigences, 

OTTH — suluLiun — de — 1 ' art — ccttma — consi s t e — a — rcmplacor — ies 

processeurs fautifs par des processeurs supplementaires 

15 identiques aux autres du point de vue fonctionnel. Une 
telle solution, permettant une « tolerance aux fautes 
structurelle » , s'ef force alors a garantir le bon 
f one ti onnement , et notamment la coherence du reseau, 
pour ne pas penaliser 1 ' architecture , Elle implique une 

20 reconfiguration consistant dans le remplacement 
d' elements fautifs par des elements supplementaires 
disponibles grace a des elements d' interconnexion et a 
des elements d' intercommunication . 

Dans un reseau de type 2D (ou en deux ^ 

2 5 dimensions) , les solutions proposees pour assurer la 

tolerance aux fautes consistent : 

© A a j outer au systeme autant de lignes de 
processeurs qu'on veut tolerer de fautes. Cette 
solution est tres simple et necessite peu 

3 0 d' interconnexions supplementaires, la reconfiguration 

s'effectuant par une simple derivation (en anglais 
« Bypass ») des lignes ou un processeur est fautif . Les 
pertes en performance sent alors limitees. Par centre, 
1 'utilisation des processeurs supplementaires est tres 
3 5 mauvaise puisqu'il faut une ligne pour tolerer une 
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faute, et gu'en cas de faute d'une derivation le 
systeme complet est mis en defaut. 

• Ou, a a j outer des commutateurs , des 
processeurs suppl ement aires , et des connexions au 
5 reseau normal . 

CoimiLe — deer It Jans — Ikd ducmubiiiL lelfcixeiicfci — [2] , — crrr 

reseau correspondant a ce second type de solution et 
appele « m-Track, n-Spare » (ou « m chemins , n 

10 supplementaires ») se compose de processeurs 10, de 
commutateurs et de connexions supplementaires • Deux 
sortes de commutateurs sont utilises : les commutateurs 

11 reliant les processeurs aU2£ connexions LEI ponr 

« Processor to Track ») et les commutateurs 12 reliant 

15 les connexions entre elles (TT pour « Track-to- 
Track ») . Toutes les liaisons du reseau sont 
bidirectionnelles , c'est-a-dire que les communications 
peuvent aller dans les deux sens dans chague connexion. 
Des processeurs supplementaires 13 (sp) sont 

20 positionnes aux frontieres du reseau. Ces processeurs, 
pour que la methode de reconfiguration soit efficace, 
doivent etre places au moins sur une ligne et una 
colonne du reseau. 

La figure 1 illustre un exemple de reseau de 

25 type « 2-Track, 1-Spare ». Des processeurs 

supplementaires 13 (sp) sont places tout autour du 
reseau et servent k reconfigurer le reseau en cas de 
faute des processeurs utiles 10. Des commutateurs 11, 
12 sont utilises pour permettre la reconfiguration. Le 

30 reseau comprend ici 2 00 % de connexions supplementaires 
par rapport aux connexions dites f onctionnelles . 

L'homme de metier peut alors utiliser une 
m6thode de reconfiguration, basee sur des codes 
correcteurs d'erreur, se decomposant en deux phases : 
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- la premiere consiste, pour chaque processeur 
fautif, a trouver un cheinin de compensation qui 
contourne le processeur fautif et le remplace par un 
processeur supplementaire ; 

5 - en cas de reussite de la premiere phase, 

chaque processeur est , le long du chemin de 
compensation, remplace par son plus proche voisin, en 
allant ainsi, par des changements en cascade, jusqu'a 
un processeur supplementaire. La grille f onctionnelle 
10 est ainsi conservee. 

La methode de reconfiguration consideree ci- 
dessus possede deux d6savantages majeurs : 

elle — n' est — pHB — adapt^e — an — cars — des — liaisons 

monodirectionnelles ; dans ce cas en effet, deux bus de 
15 connexion, un aller et un retour, sont necessaires pour 
connecter le processeur considere a chacun de ses 
voisins, 

- le nombre d' elements de commutation traverses 
entre deux processeurs voisins logiquement n'est pas 

2 0 deterministe, ce qui rend la methode inefficace pour 

traiter le cas des communications synchrones entre 
processeurs . 

Pour resoudre ces inconvenients , le procede de 
25 1' invention a pour objectif de resoudre le probleme de 
la tolerance aux f autes dans une architecture 
massivement parallele ou les elements fonctionnels sont 
tres fortement couples, en proposant une solution 
repondant aux contraintes suivantes : 

3 0 - obtenir un reseau tolerant aux f autes avec 

des connexions pouvant §tre monodirectionnelles ; 

- limiter fortement les supports de 
communication non fonctionnels du reseau ; 

- limiter le temps de communication entre 
3 5 elements fonctionnels en limitant le nombre de 
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coiranutateurs de reconfiguration traverses entre deux 
elements fonctionnels ; 

- autoriser une plus grande souplesse dans le 
choix du nombre d' elements fonctionnels 

5 supplementaires ; 

- disposer d'une solution capable de supporter 
des topologies ditt erentes , notaininent en matrice, en 
anneau , ou en hypercube . 



10 Expose de 1 ' invention 

La presente invention concerne un precede de 
reconfiguration d'un reseau d' elements fonctionnels 

idcntiquGD — parallolos — avoc — toloranco — aux — f aut es — de — c e s 

elements fonctionnels, le reseau comportant lesdits 
15 elements fonctionnels de base, des elements 
fonctionnels supplementaires, des elements 

d' interconnexion de ces elements fonctionnels et une 
unite de contr61e, ledit precede comprenant : 

- une etape de placement des elements 

2 0 fonctionnels du reseau logique ; 

- une etape de routage consistant en une 
programmation des elements d ' interconnexion sur le 
reseau physique en choisissant le nombre maximal de ces 
elements d' interconnexion pouvant §tre traverses entre 

25 deux Elements fonctionnels voisins utilisant un 
algorithme de recherche du plus court chemin, 
Dans ce procede de 1' invention : 

- on determine un ordre de placement des 
elements fonctionnels du reseau qui est constitue d'un 

3 0 element fonctionnel d'origine et d'une suite d' elements 

fonctionnels englobant tous les elements fonctionnels ; 

- pour chacun des elements fonctionnels on 
essaie de le placer en commengant par sa place logique 
puis, si necessaire en cas d'echec, en chacune des 

35 places situees a une distance 1, a une distance 2... de 
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la place logique de cet element fonctionnel, avec comme 
restriction qu'une et une seule place supplementaire 
doit etre utilisee par rapport aux places possibles des 
elements fonctionnels precedeirmient places, en arretant 
5 lorsque S+1 places ont ete essayees, S etant le nombre 
d' elements fonctionnels supplementaires ; 

- si S+1 places ont ete essayees sans succes, 
on revient a 1' element fonctionnel precedent dans 
I'ordre de placement et on passe a la place suivante 

10 pour cet element fonctionnel ; 

- eventuellement lorsque tous les elements 
fonctionnels sont places, on verifie pour chaque 

dimension — dn — r^seau — qxre — 1 ' ordre — logique — est — respQctc 

pour chaque couple d' elements fonctionnels, si ce n'est 
15 pas le cas on inverse les places de ces elements 
fonctionnels . 

Dans un mode de realisation, I'ordre de 
placement est d^fini ainsi : 1' element fonctionnel 
d'origine est 1' element fonctionnel en haut a gauche, 
20 les elements fonctionnels suivants sont les elements 
fonctionnels a droite et en bas de 1' element 
fonctionnel d'origine, et ainsi de suite en respectant 
la diagonale. 

On peut egalement decouper le reseau en blocs 
25 et definir un ordre de placement des blocs en partant 
d'un bloc d'origine et en parcourant tous les blocs de 
bloc voisin en bloc voisin, les places pour les 
elements fonctionnels d'un bloc ne comportant pas de 
place logique des elements fonctionnels des blocs 
30 places precedexmnent . 

Avantageusement ce precede de 1' invention peut 
etre mis en oeuvre soit de maniere statique, soit de 
maniere dynamique en cours de f onctionnement . 

II parait important de preciser les deux points 
3 5 suivants : 
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o Le precede de 1' invention permet d'inclure 
facilement des possibilites de tolerance aux fautes au 
niveau des interconnexions et des elements 
d ' interconnexion . 
5 o Le precede de 1' invention est a contre-pied 

des precedes antecedents dans le sens ou les 

cayaet^ rlgtlcyA^g du r^ s^au sent nombir^ de liens 

supplementaires et 1 ' organisation des elements 
d' interconnexions ne sont pas imposes par le precede, 

10 ce qui permet une plus grande souplesse dans le choix 
de 1 ' architecture tolerante aux fautes. 

Breve description des dessins 

La figure 1 illustre un reseau de processeurs 
15 de 1 ' art connu. 

Les figures 2A et 2B illustrent un exemple de 
reseau obtenu par le precede de 1' invention. 

La figure 3 illustre la notion de distance dans 
le reseau illustre sur la figure 2B . 
20 La figure 4 illustre un organigramme du precede 

de 1' invention. 

Les figures 5A et 5B illustrent un exemple de 
non coherence du precede de 1' invention apres le 
placement des elements f onctionnels . 
25 Les figures 6A, 6B et 6C illustrent un exemple 

d'algorithme de placement deduit directement du precede 
de 1' invention. 

La figure 7 illustre un algorithme par bloc 
deduit du precede de 1' invention. 
30 Les figures 8A et 8B illustrent des exemples de 

reconfiguration d'un reseau d' Elements f onctionnels 
dans une topologie de matrice. 

La figure 9 illustre la composition d'un reseau 
de processeurs ebtenu par le proc6de de 1' invention. 



o 



o 
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La figure 10 illustre les entrees et sorties 
d'un element d' interconnexion interne au reseau de la 
figure 9 . 

Les figures llA a IIH illustrent les entrees et 
5 sorties des elements d' interconnexion aux frontieres du 
reseau de la figure 9 . 

La figure 12 illustre le reseau de la figure 9, 
avec les liaisons entre processeurs et elements 
d' interconnexion. 
10 Les figures 13A a 13C illustrent les 

communications minimales dans le reseau de la figure 9. Q 
Les figures 14A et 14B illustrent la 

r^allsaLluii jjraticfue d 'un elem e nt d^ intGrconncxion 

interne au reseau de la figure 9 a partir d'un 
15 multiplexeur 6 vers 1. 

La figure 15 illustre un exemple de mise en 
oeuvre du reseau de la figure 9. 

Les figures 16 a 19 illustre plusieurs exemples 
de reseau de processeurs de type hypercube, a savoir un 
20 hypercube de dimension 3 sur la figure 16, un hypercube 
de structure reguliere virtuelle avec quatre 
processeurs supplementaires sur la figure 11, un 
exemple de reconfiguration d' hypercube comprenant trois 
processeurs fautifs deduits du precede de 1 ' invention 

o 

25 sur la figure 18, et un hypercube de dimension 4 
comprenant une ligne de processeurs supplementaires sur 

la figure 19. 

La figure 20 illustre 1 ' architecture d'un 

correlateur 2D. 

30 La figure 21 illustre un exemple d' utilisation 

du precede de 1 ' invention dans la structure matricielle 
de 1 ' architecture illustree sur la figure 20. 
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Expose detaille de modes de realisation 

La presente invention concerne un precede de 
reconfiguration d'un reseau d' elements fonctionnels 
identiques . 



o 



Pracdde de reconfigfurAtlon 

Dans la structure « m-Track, n- Spare » de 1 ' art 
connu, illustree sur la figure 1, le proced6 de 
reconfiguration consiste a rechercher un chemin appele 

10 « chemin de compensation » pour remplacer un element 
fonctionnel elementaire fautif par un element 
fonctionnel supplementaire . Ensuite en partant de cet 

e l e ment — fonctionnel — e l e mentair e — fautif , — chaquo — olomont 

fonctionnel est remplace par 1' element fonctionnel 

15 suivant disponible, le plus proche sur le chemin. Mais 
ce precede n'est vraiment efficace que lorsque des 
elements fonctionnels supplementaires existent dans au 
moins une ligne et une colonne, ce qui n'est pas 
possible avec une ligne d' elements fonctionnels 

20 supplementaires et deux chemins monodirectionnels . De 
plus un tel procede ne permet pas de reduire le nombre 
de commutateurs dans les chemins de communication . 

Par centre le procede de reconfiguration de 
1 ' invention est base sur une technique de placement 

25 decorrel6e du routage. 

Le placement consiste en un placement physique 
d' elements fonctionnels voisins logiques. La place 
logique d'un element fonctionnel est la place que cet 
element fonctionnel occupe dans le reseau sans 616ment 

3 0 fonctionnel fautif ; la place physique d'un element 
fonctionnel est la place occupee par cet element 
fonctionnel apres application du proc6d6 lorsqu'une 
faute a ete detectee. Le placement est sur d'aboutir a 
condition que le nombre d' elements fonctionnels fautif s 
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soit inferieur ou egal au nombre d' elements 
f onctionnels supplementaires . 

Le routage consiste en une programmation des 
elements d' interconnexion. Le nombre de commutateurs 
5 qui peut §tre traverse entre deux elements fonctionnels 
voisins est choisi . Ce nombre est limite : trois ou 
quatre commutateurs conduisent a un bon rendement de 
reconfiguration, L'algorithme de routage peut ainsi 
essayer le plus grand nombre de possibilites de routage 

10 dans un temps tres court avec un algorithme approprie. 

Dans les systemes de 1 ' art anterieur, la Q) 
programmation des elements de commutation est assuree 
des lors qu'une place de remplacement es^^ crouvee pour 
chaque element fonctionnel fautif en suivant un 

15 algorithme precis. Les algorithmes de placement des 
elements fonctionnels sur la grille physique et de 
routage des elements de commutation sont 
indissociables . 

Dans le precede de 1' invention, seul le 

20 placement des elements fonctionnels est original. Le 
routage des elements d' interconnexion est effectue par 
un algorithme de recherche du plus court chemin connu 
de I'homme de metier, cet algorithme etant utilisable 
dans 1' invention grace aux restrictions faites sur la O 

25 longueur des chemins et, notamment, sur le nombre 
d' elements d' interconnexions traverses. 



o Etape de placement 

Sur les figures 2 et 3 est illustre 

3 0 schematiquement un reseau d' elements fonctionnels 
elementaires identiques 30, chaque element fonctionnel 
de base etant logiquement connecte avec un nombre 
identique d' elements fonctionnels voisins du meme 
reseau, a 1' exception des elements fonctionnels situes 

3 5 sur les bords du reseau, et d' elements fonctionnels 
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supplementaires 31 prevus chacun pour remplacer un des 
elements fonctionnels elementaires 3 0 en cas de faute 
de celui-ci. 

La figure 2A illustre un element fonctionnel du 
5 reseau avec ses quatre voisins logiques. La figure 2B 
illustre un exemple de reseau, les elements 
fonctionnels supplemencaires 3T etant mdiques en" 
grise, les liaisons 32 6tant les liaisons logiques. 

La figure 3 illustre la notion de distance 
10 entre deux elements fonctionnels : celle-ci est le 
nombre minimum de connexions necessaires pour aller 
d'un element fonctionnel a un autre. Les deux elements 
f onct i onne ls — 35 — cercle s — — noir — sont — a — «iie — diotancc — de- 
cinq I'un de 1 'autre, deux elements fonctionnels 
15 voisins etant a une distance unite. 

Le precede de 1' invention a pour objet de 
placer les elements fonctionnels dans le reseau, de 
maniere a minimiser la somme des distances entre tous 
les elements fonctionnels voisins. Ce procede presente 
20 les caracteristiques suivantes : 

• Critere 1 : pour choisir les places des 
elements fonctionnels afin d' assurer une distance 
minimale entre elements fonctionnels voisins, on 
effectue un placement autour de la position de 

25 1' element fonctionnel d'origine en utilisant les 
Elements fonctionnels a une distance 0 puis 1, puis 2, 
puis 3 . . , de la place logique de cet element 
fonctionnel . 

• Critere 2 : pour s' assurer qu'un placement 
3 0 est possible pour tous les elements fonctionnels du 

reseau, quel que soit le nombre d' elements fonctionnels 
fautifs ou non valides, on definit tout d'abord un 
ordre de placement des elements fonctionnels qui est 
constitue d'un element fonctionnel d'origine et d'une 
3 5 suite d' elements fonctionnels englobant tous les 
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elements f onctionnels . Chaque element fonctionnel 
nouveau est choisi parmi les elements fonctionnels 
voisins, logiquement des elements fonctionnels 
precedents. Puis, en suivant cet ordre allant de 
5 1' element fonctionnel d'origine au dernier element 
fonctionnel, on definit S+1 places possibles, S etant 
Te nombre d' elements fonctionnels supplement aires , et 
1' ordre des places de chaque element fonctionnel, avec 
comme restriction qu'une et une seule place 
10 supplementaire doit etre utilisee par rapport aux 

places possibles des elements fonctionnels precedemment ^ 
places . 

o Crit «fe — 3- — : — pour — assurer — ia — coh e r e nc e — globalo 

du reseau, on met eventuellement en place en fin de 

15 placement un mecanisme de respect de la coherence qui 
consists en une detection des inversions logiques de 
chaque couple des elements fonctionnels voisins 
logiquement dans chaque dimension et en une inversion 
des places des deux elements fonctionnels lorsqu'une 

20 telle inversion est detectee. 

Pour remplir ces differents criteres, le 
precede de 1' invention comprend les etapes suivantes : 

- on determine un ordre de placement des ^ 
25 elements fonctionnels comme defini ci-dessus au critere 

2 ; 

- pour chacun des elements fonctionnels, on 
essaie de le placer en commengant par sa place logique, 
puis si necessaire en cas d'echec (element fonctionnel 

3 0 fautif ou place occupee par un autre element 
fonctionnel) en chacune des places situees a une 
distance 1, a une distance 2 etc., tout en respectant 
la loi enoncee dans le critere 2 : c ' est-a-dire qu'une 
et une seule place supplementaire doit dtre utilisee 

3 5 par rapport aux places possibles des elements 



B 13299.3 DB 



13 

f onctionnels precedemment places . Si la place ne 
respecte pas cette loi, on essaie une autre place, qui 
peut etre a une distance plus grande si necessaire. On 
arrete lorsgue S+1 places ont et6 essayees ; 
5 - si S+1 places ont ete essayees sans succes, 

on remonte a 1' element fonctionnel precedent dans 
I'ordre de placement et on passe a la place suivante 
pour cet element fonctionnel ; 

- lorsque les elements fonctionnels sont tous 
10 places, on verifie pour chaque dimension du systeme, 
par exemple en ligne et en colonne pour un tableau 
d' elements fonctionnels, que I'ordre logique est 

respecte pour chaque couple d' 616i[ienLs luucLiomiels , — Bir- 

ce n'est pas le cas, on inverse les places de ces 
15 elements fonctionnels . 

L' organigramme illustre sur la figure 4 resuine 
les trois dernieres etapes de ce precede. 

Les figures 5A et 5B illustrent un exemple de 
non coherence dans le reseau apres le placement des 
20 elements fonctionnels. En effet sur la figure 5A les 
deux elements fonctionnels Pij et Pij+i sont voisins 
logiques et Pij se situe avant Pij+i. Sur la figure 5B 
1' element fonctionnel Pij se trouve place apr^s 
(3 1' element fonctionnel Pij^n contrairement a son ordre 

25 logique, la fleche 36 illustrant I'ordre de placement, 
les endroits marques d'une croix indiquant des places 
occupees par des 616ments fonctionnels f autif s . 

Cet algorithme de placement est certain 
d'aboutir a une solution du moment que le nombre 
30 d' elements f autif s est inferieur ou egal au nombre 
d' elements fonctionnels supplementaires . 

Deux types d' algorithmes de placement peuvent 
etre induits du precede de 1' invention. 
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Le premier type d' algorithme consiste en une 
utilisation directe du procede de 1' invention et est 
illustre par la figure 6 avec une structure de 4x4 
elements f onctionnels elementaires et 4 elements 
5 f onctionnels supplementaires . 

La figure 6A illustre le reseau logique, les 
voisins logiques d'un element fonctionnel etant aux 
quatre points cardinaux de celui-ci. La figure 6B 
illustre 1 ' ordre de placement des elements f onctionnels 
10 et la figure 6C illustre les places possibles de ces 
elements f onctionnels , les places a une distance de 1 
de la place logique de 1' element fonctionnel etant 
essayees avant les places a une distance de etc - 

Sur cette figure 6C on utilise les 
15 representations suivantes : 

place logique de 1' element fonctionnel 
place nouvelle de 1' element fonctionnel 
place possible de 1' element fonctionnel 



20 L' ordre de placement est defini ainsi : 

1' element fonctionnel d'origine est 1' element 
fonctionnel en haut a gauche Po,o- Les elements 
f onctionnels suivants sont les elements f onctionnels a 
droite Po,i et en bas Pi,o 1' element fonctionnel 

25 d'origine Po,o/ et ainsi de suite en respectant la 
diagonale Pi,o ; Po,2 ; (voir figure 6B) . Cette 

solution, qui est une des solutions possibles pour le 
choix de 1 ' ordre de placement, a 1 ' avantage de 
permettre de bien respecter le critere 1 dans la suite, 

3 0 et done de fournir un placement qui permet un bon 
routage. A partir de cet ordre de placement, les places 
de chaque element fonctionnel sont choisies parmi les 
cinq places definies sur la figure 6C, leur ordre de 
selection respectant le critere 1. On note que, pour 

35 chaque element fonctionnel, le critere 2 est respecte. 
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Le deuxieme type d' algorithme de placement est 
une application du precede de 1' invention en decoupant 
le reseau en blocs d' elements f onctionnels . Apres avoir 
defini un ordre de placement des blocs, en partant d'un 
5 bloc d'origine on parcourt tous les blocs, de bloc 
voisin en bloc voisin. Si un tel algorithme est 
applique a chaque bloc en tenant compte d'une regie de 
placement telle que les places possibles pour les 
elements f onctionnels d'un bloc ne comportent pas de 
10 place logique des elements fonctionnels des blocs 
places precedemment , le placement est sur. La figure 7 
illustre ce deuxieme type d' algorithme en considerant 

cm blue lurme d ' uiie liyiib ! de quatre eltdiuenLs 

fonctionnels. Les lignes d' elements fonctionnels sont 
15 alors plac^es en partant de la ligne du haut pour aller 
a la ligne du bas. Pour chaque ligne on utilise des 
places de cette ligne, a laquelle appartiennent les 
elements fonctionnels logiques, et de la ligne 
immediatement inferieure, ce qui permet de respecter la 
20 regie ci-dessus. Pour chaque ligne, 1 ' ordre de 
placement est d6fini par 1' element fonctionnel 
d'origine situe a 1' extreme gauche et puis par les 
elements fonctionnels suivants a droite. Les cinq 
places possibles sont alors d^finies comme le montre la 
25 figure 7. Le meme algorithme de placement est utilise 
pour chaque ligne. La verification de coherence, 
inutile dans I'exemple consid6re, ne doit alors 
s'effectuer que sur les lignes. L'avantage de cette 
variante du proced6 de 1' invention reside dans la 
3 0 rapidity de 1' algorithme (moins de re tour en arriere, 
verification de coherence plus courte) associee a un 
bon placement lorsque les blocs sont bien dimensionnes 
par rapport aux elements supplementaires , ce qui est le 
cas de I'exemple consid^re. 
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La figure 8A illustre un exemple de 
configuration du reseau dans une topologie de matrice, 
sans element fonctionnel fautif, pour des connexions 
ouest-est et nord-sud. La figure 8B illustre un exemple 
5 de reconfiguration du reseau dans le cas d'un element 
fonctionnel fautif, represents avec des hachures . 

On remarque que le passage par les elements de 
commutation est obligatoire meme en 1' absence 
d' elements fautifs, ce qui donne une certaine coherence 
10 pour 1' ensemble du systeme. 



o Etape de rentage 

Cette etape es^ ettectuee a 1 ' aide 
d'algorithmes de recherche du plus court chemin et de 

15 recherche en profondeur connus de I'homme du metier. 

De fagon a rester coherent avec les objectifs 
fixes en introduction, le nombre d' elements 
d' interconnexion entre elements fonctionnels voisins 
logiques est limite a un petit nombre, typiquement 3 ou 

20 4 . Le nombre de chemins possibles pour aller d'un 
element fonctionnel i un element fonctionnel voisin est 
connu et assez faible, moins d'une dizaine en moyenne. 
On suppose que tous ces chemins sont connus mais ils 
peuvent egalement etre calcules par un algorithme de 

25 recherche du plus court chemin. Un exerrple sinple de 
1' algorithme de routage en recherche en profondeur des elements 
d' interconnexion est donne ci-dessous : 



Initialiser i etjaO 
3 0 Point 0 : Pour le couple Q d 'elements fonctionnels voisins : 
Point 1 : Si le chemin Qft) existe : 

essayer le routage de Cj avec ce chemin 
Si ilya conflit sur un element d' interconnexion 
incrementer i et retour au Point 1 

3 5 Sinon, 
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Si il existe d'autres couples C d 'elements fonctionnels : 
incrementer j et retour au Point 0 

Sinon, 

routage reussi, fin 

Sinon, 

Si il existe un couple Ck d' elements fonctionnels dont le routage 



rend le routage de Q impossible 

Supprimer tous les routages entre Ck et Q 
Incrementer le chemin i de Ck et retour au point 0 

10 Sinon 

Routage impossible 

Fin 

Ceci n'est qoi'un exemple de routage connu de 
15 I'homme du metier permettant de donner un exemple de 
realisation du procede de reconfiguration de 
1 ' invention. 

On va considerer ci-dessous successivement des 
20 exemples de realisation de reseaux auxquels s' applique 
le procede de 1' invention, dans lesquels les elements 
fonctionnels sont des processeurs. 

Exemple d^un reseau de processeurs paralleles 
25 Un reseau de processeurs auquel s' applique 

1' invention, comma illustre sur la figure 9, est base 
sur une matrice de processeurs elementaires quelconques 
P a deux entrees et deux sorties, relics entre eux par 
des elements d ' interconnexion Cm. Le reseau est compost 
3 0 d'un ensemble de lignes d' elements interconnexion 2 0 et 
de lignes de processeurs 21 disposees alternativement . 
Chaque processeur P est entoure de quatre elements 
d' interconnexion Cm. Les elements de bord du reseau 
sont des elements d' interconnexion Cm. Les lignes de 
3 5 processeurs sont des lignes de processeurs elementaires 
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P et la derniere ligne de processeurs est une ligne de 
processeurs elementaires supplementaires Sp. Une telle 
caracteristique permet d'obtenir une plus grande 
souplesse dans le choix du nombre de processeurs 
supplementaires contrairement au dispositif de I'art 
anterieur illustre sur la figure 1, dans lequel avec 
une ligne et une colonne de processeurs supplementaires 
la proportion de processeurs supplementaires varie en 
fonction du produit du nombre de lignes par le nombre 
de colonnes. 

Les elements d' interconnexion Cm permettent de 
realiser les liaisons, par commutation du reseau, entre 
les differents processeurs P. Un element Cm de ce type 
est illustre sur la figure 10, avec ses differentes 
entrees et sorties. II possede six entrees et six 
sorties monodirectionnelles reliees respectivement aux 
entrees des processeurs sud-ouest et nord-est, aux 
sorties des processeurs nord-ouest et sud-est, et aux 
quatre entrees et quatre sorties des elements 
d' interconnexion situes au nord, a I'est, au sud et a 
I'ouest. Un element ainsi represente correspond a un 
element du centre du reseau. 

Comme illustre sur les figures llA a llH, les 
elements d' interconnexion des bords du reseau possedent 
moins d' entrees et/ou moins de sorties selon leur 
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Chaque sortie d'un element d' interconnexion Cm 
peut etre reliee a n'importe quelle entree. II est 
possible de changer de fagon dynamique la maniere 
( appelee configuration) de realiser ces liaisons au 
5 moyen, par exemple, de registres de configuration 
associes a une commande de configuration. 

Comma il lustre sur la figure 12 , dans ce reseau 
chaque processeur P est relie a quatre ^l^ments 
d' interconnexion Cm, deux de ces elements Cm 
10 diametralement opposes etant connectes aux deux entrees 
du processeur et les deux autres elements Cm, egalement 
diametralement opposes , etant connectes aux deux 

oortics — du processeur . — Ges — elements — d ' inter conneAiuii Cm 

sont de plus relies entre eux par des liaisons 
15 horizontales et verticales . 

Chaque communication entre processeurs P se 
fait par 1 ' intermediaire d' elements d' interconnexion 
Cm. On obtient ainsi 50 % de connexions internes 
supplementaires par rapport aux connexions 

20 « f onctionnelles » et des connexions supplementaires 
avec I'exterieur reduites aux connexions des 
processeurs supplementaires Sp . 

Les communications support6es par le reseau 
sont au minimum celles d^crites sur la figure 13 : des 
25 communications sud vers nord et est vers ouest etant 
illustr^es sur la figure 13A ; des communications 
m^langees etant illustr^es sur la figure 13B ; des 
communications est -ouest etant illustr^es sur la figure 
13C ; Chaque communication illustree sur ces figures 
3 0 ayant une communication « duale ». 

D' autres communications peuvent bien entendu 
etre envisagees . 

Dans le precede de tolerance aux fautes de ce 
reseau, les processeurs supplementaires Sp de la 
35 derniere ligne sont utilises pour remplacer des 



o 
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processeurs elementaires P defaillants dans les autres 
lignes. 

Exemple d'un mode de realisation d'un tel reseau de 
5 processeurs 

Dans ce mode de realisation le reseau de 
processeurs est constitue d'une matrice de neuf 
processeurs et de seize elements d' interconnexion , 
Chaque processeur P est un simple element de calcul 
10 integrant une unite logique et arithmetique, un 
ensemble de registres de travail et une logique de test 
permettant d'effectuer le test automatique du 

processeur — (test: dlt « lnL6yx6 ») . — Luxfc de 1' execution 

d'un programme de test, cette logique emet un signal de 
15 test d'integrite t_i indiquant si le processeur est 
defaillant. Le processeur P n'est pas decrit ici car il 
est bien connu de I'homme de metier. 

Un element d' interconnexion est du type de 
celui illustre sur la figure 10, les elements d'inter- 

2 0 connexion des figures llA a IIH n'etant que des derives 

simplifies de celui-ci. Get element d' interconnexion, 
illustre sur la figure 14A, est compose de six 
multiplexeurs de donnees de six entrees vers une 
sortie. Chacun de ces multiplexeurs est commande par 
25 trois fils de selection de la voie de sortie afin de 
permettre de relier chacune des sorties de 1' element 
d' interconnexion a n'importe quelle entree. La largeur 
du champ de donnee de chacune des voies est ici de 4 
bits. Les selections des six multiplexeurs sont 

3 0 memorisees dans deux registres 40 de 18 bits chacun (3 

bits de selection pour chaque multiplexeur ) a 
I'interieur de 1 ' element d' interconnexion . Ces 
registres 40 ont une double f onctionnalite puisqu'ils 
peuvent fonctionner en registres normaux et en 
3 5 registres a decalage lors du chargement. Ces deux 
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registres de configuration 40 permettent a deux 
configurations differentes du reseau de cohabiter 
dynamiquement . 

La figure 14B illustre le detail du controle 
5 d'un multiplexeur , la zone 41 etant la zone de commande 
de ce multiplexeur dans un des registres 40. 

Le chargement des deux registres de 
reconfiguration 40 s'effectue en serie grace aux 
signaux nw_sw et confsw__in* Le signal nw_sw {« not- 

10 write switch ») autorise I'ecriture du signal de 
configuration confsw_in (« configuration switch 
input ») dans la premiere bascule d'un registre 40 

lorscgu' 11 est k I ' ^taL bas kdL ixiLexdlL ueLLe ecriture a - 

I'etat haut. Le chargement des configurations est 

15 synchrone et obeit done a I'horloge globale du systeme 
elk. Lorsque I'ecriture de confsw_in est autorisee dans 
la premiere bascule d'un des registres 40, le contenu 
de cette bascule est charge dans la deuxieme bascule et 
ainsi de suite jusqu'a la derniere bascule, dont le 

20 contenu constitue le signal confsw„in de 1' element 
d' interconnexion suivant . Le signal sel_swl2 
(« selection switch configuration 1/2 ») permet de 
selectionner , lors du chargement, le registre ou 
charger les configurations et egalement de selectionner 

25 la configuration des Elements d' interconnexion de 
maniere dynamique, c'est-a-dire de faire varier la 
configuration des elements d' interconnexion lors du 
deroulement d'un programme, a chaque coup d'horloge. Un 
element d' interconnexion est ainsi compose de 24 bits 

3 0 de donnees en entree, de 2 4 bits de donn6es en sortie, 
de deux signaux de chargement de configuration et d'un 
signal de changement dynamique de configuration (en 
cours de f onctionnement normal) entre les 
configurations chargees dans les registres internes des 

35 elements d' interconnexion . 
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Les processeurs P et les elements 
d' interconnexion Cm sont connectes comme illustre sur 
la figure 15. L' ensemble forme la matrice de 
processeurs qui est commandee par une unite de controle 
5 UC. Cette unite de controle UC envoie les instructions 

aux processeurs permettant d'effectuer les operations 

et controle les elements d' interconnexion a I'aide des 
trois signaux confsw_in, nw_sw et sel_swl2 precedemment 
cites. L' unite de controle permet ainsi le d^roulement 

10 de programmes normaux ainsi que de programmes de test 
des processeurs. L' unite de controle effectue de fagon 
periodique le test des processeurs qui retournent ci un 
controleur leur etat par 1 ' intermediaire du signal t_± . 
Le diagnostic de la matrice de processeurs est alors 

15 effectue par le controleur grace a 1 ' interpretation des 
signaux t_i de tous les processeurs . Le contr61eur peut 
effectuer le calcul des nouvelles configurations des 
elements d ' interconnexion correspondant a I'etat de la 
matrice de processeurs. II informe alors 1 'unite de 

2 0 controle de ces nouvelles configurations, L' unite de 

controle envoie alors les informations permettant de 
configurer les differents elements d' interconnexion, 
puis envoie les commandes d' execution des programmes de 
calculs sur les processeurs actifs. 
25 La matrice de processeurs ainsi que les 

elements d ' interconnexion peuvent etre integres dans un 
circuit integre specif ique (ASIC) . L' unite de controle 
peut etre integree dans des composants de logique 
reconf igurable (FPGA pour « Field Programmable Gate 

3 0 Array ») , ceci pour une plus grande souplesse 

d' utilisation. Le controleur peut etre realise a I'aide 
d'un ordinateur, d'un composant FPGA ou meme d'un 
module dedie. 

Dans la description precedente, on a envisage 
3 5 une commande dynamique separee de chacun des elements 
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d' interconnexion par I'unite de controls ; on pourrait, 
sans sortir du cadre de 1' invention, effectuer ladite 
commande de fagon statique, sans passer par I'unite de 
controle, par exemple par le biais d'un processeur 
5 exterieur au systeme . 



Exemple d'un reseau d'hypercubes 

Un grand nombre d' architectures qui possedent 
la regie de regularite, ou que I'on peut ramener a une 
10 structure reguliere telle que definie pr^cedemment 
peuvent benef icier du proc6de de placement de 
1 * invention, 

Uii exemple xeseau regulier — est — 1 ' hyper cubtd — a- 

n dimensions. Dans ce reseau de processeurs, chaque 

15 processeur est relie directement a n autres processeurs 
en respectant une regie sur la numerotation binaire des 
processeurs (chaque processeur est relie aux 
processeurs dont le mot binaire est adjacent, i.e. dont 
le numero binaire ne differe que d'un seul bit). Un 

20 exemple d'hypercube de dimension 3 et comprenant done 
16 processeurs est donne sur la figure 16. 

Cette structure, qui est reguliere lorsqu'elle 
est representee dans I'espace, perd sa regular! t6 sur 
le papier par un effet de perspective. Mais elle perd 

25 egalement sa regularity lorsqu'elle est r^alisee sur 
une carte 61ectronique qui n'accepte que des composants 
sur sa surface. Afin de prendre en compte ce point, le 
reseau pr^sente sur la figure 17 montre les liens 
r6els, les liens virtuels qui permettent de rendre la 

3 0 structure reguliere en deux dimensions, et les 
processeurs supplementaires Sp avec les liens 
(virtuels) les reliant a la structure principale. 

On se ramene ainsi a une structure 2-D 
reguliere comprenant quatre processeurs 

35 supplementaires. La notion de distance qui definit la 
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mesure pour le placement « au plus pres » des 
processeurs est une distance calculee par rapport a 
cette structure. Dans ces conditions, les algorithmes 
de placement sont les memes que ceux utilises pour le 
5 maillage 2-D, la realisation physique du reseau primant 

sur sa fonction logique. 

La figure 18 montre alors un exeinple de 
reconfiguration obtenue avec trois processeurs fautifs. 
les liens en traits pleins sont les liens physiques 

10 qu'il faut realiser de fagon a conserver la structure 
d ' hyper cube . 

Enfin, la figure 19 montre une extension du 
principe de liens virtuels pour un reseau nypercuDe ae 
dimension 4 comprenant une ligne de processeurs 
15 supplementaires . L'algorithme de placement utilise est 
alors le m§me que celui utilise pour la structure 
maillage 2-D comprenant 8 ligries x 4 colonnes et une 
ligne de processeurs supplementaires. 

Le precede de reconfiguration ne restraint pas 
2 0 le choix de la structure tolerante aux fautes sur 
laquelle peut gtre r^alisee une telle structure, qui 
peut done etre tout a fait arbitraire. 

Le precede de 1' invention peut etre egalement 
utilise en vue d'obtenir une structure tolerante aux 

2 5 fautes, dans des architectures des systemes 

electroniques numeriques utilisant un grand nombre 
d' elements fonctionnels identiques interconnectes en 
ligne, en matrice ou en hypercube . La seule contrainte 
est d' assurer que chaque element fonctionnel soit 

3 0 testable soit de maniere locale, soit de maniere 

globale afin que l'algorithme de placement/routage 
puisse avoir la connaissance des elements fonctionnels 
def aillants . 

II est difficile d' identifier toutes les 
3 5 architectures electroniques capables de tirer profit de 
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1' invention. On peut toutefois presenter quelques 
exemples . 



o 



o CorrelatGur ID ou 2D 
5 II s'agit de 1 ' association en ligne ou en 

matrice d' elements fonctionnels dont le r61e est 
d'effectuer une m-ultiplication des entrees suivie d'une 
addition du resultat de cette multiplication avec le 
resultat precedent. On parle alors de Multiplieur 

10 Accumulateur (MAc) , comme illustre sur la figure 20. 
Les donnees « entree ligne » sont correlees avec les 
« entree colonne » grace a des cellules Multiplieur 

AccuiimlaLfaiUX (MAc) uxyaiiimSes en Lableau, LouLes 

identiques, II est alors facile de mettre en oeuvre le 

15 precede de 1' invention, comme illustre sur la figure 
21. La derniere ligne de la matrice constitue la ligne 
de « MAc spare » . 



o Architecture de matricB de blocs de calculs de la 

2 0 trans fojrmee de Fourier rapide (FFT) 

Cette architecture est egalement organisee 
autour d'un assemblage en matrice d' elements 
fonctionnels de type MAc avec un schema 
d' interconnexion plus complexe, en multi-6tages 
25 (papillon FFT) mais toujours avec deux entries et deux 
sorties par MAc. L'ajout d'une ligne supplementaire 
d' elements fonctionnels ainsi que des 616ments de 
commutation permet de tolerer des d^faillances sur la 
structure logique complete. 

3 0 Ces deux derniers exemples montrent que le 

precede de 1' invention est utilisable sur des 
architectures electroniques numeriques interconnectant 
un ensemble d' elements fonctionnels identiques, autres 
que des processeurs. Les structures tres regulieres des 
3 5 composants FPGA (« Field Programmable Gate Array » 
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interconnectant en matrice egalement des blocs de 
logique reconf igurable (a base de memoire RAM par 
example) peuvent egalement tirer parti du precede de 
1 ' invention . 

Enfin, le domaine des telecommunications doit 
egalement tirer profit du precede de 1^ invention. En 
effet, dans les routeurs de messages par exemple, des 
elements fonctionnels identiques sont interconnectes 
pour former le systeme complet. 
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REVEND I CAT I QMS 

1. Precede de reconfiguration d'un reseau 
d' elements fonctionnels identiques paralleles avec 
5 tolerance axix fautes de ces elements fonctionnels, le 
reseau comportant lesdits elements fonctionnels de base 
(P) , des elements fonctionnels supplementaires (Sp) , 
des elements d' interconnexion (Cm) de ces elements 
fonctionnels et une unite de controle, ledit precede 
10 etant caracterise en ce cju'il comprend : 

- une etape de placement des elements 
fonctionnels du reseau logique ; 

= — aire — ^Lape — de — routage — consistant — ert — une 

programmation des elements d' interconnexion sur le 
15 reseau physique, en choisissant un nombre maximal 
d'elements d' interconnexion pouvant etre traverses 
entre deux elements fonctionnels voisins utilisant un 
algorithme de recherche du plus court chemin . 

2- Procede selon la revendication 1, dans 

2 0 lequel : 

- on determine un ordre de placement des 
elements fonctionnels du reseau qui est constitu^ d'un 
element fonctionnel d'origine et d'une suite d'elements 
fonctionnels englobant tous les elements fonctionnels ; 
25 - pour chacun des elements fonctionnels on 

essaie de le placer en commengant par sa place logique 
puis, si necessaire en cas d'echec, en chacune des 
places situees a une distance 1, a une distance 2... de 
la place logique de cet Element fonctionnel, avec comme 

3 0 restriction qu'une et une seule place supplementaire 

doit etre utilisee par rapport aux places possibles des 
elements fonctionnels precedemment places, en arr§tant 
lorsque S+1 places ont ete essayees , S etant le nombre 
d'elements fonctionnels supplementaires ; 
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- si S+1 places ont ete essayes sans 
succes, on revient a 1' element fonctionnel precedent 
dans 1 ' ordre de placement et on passe a la place 
suivante pour cet element fonctionnel . 
5 3. Precede selon la revendication 2, dans 

lequel, lorsque tous les elements fonctionnels sont 
places, on verifie pour chaque dimension du reseau que 
1' ordre logique est respecte pour chaque couple 
d' elements fonctionnels, si ce n'est pas le cas on 
10 inverse les places de ces elements fonctionnels. 

4. Precede selon la revendication 1, dans 
lequel 1 ' ordre de placement est defini ainsi : 
1 ' element fonctionnel d' orlgine est i' exement 
fonctionnel en haut a gauche, les elements fonctionnels 

15 suivants sont les elements fonctionnels a droite et en 
bas de 1' element fonctionnel d'origine, et ainsi de 
suite en respectant une diagonale. 

5. Proc6de selon la revendication 1, dans 
lequel on decoupe le reseau en blocs de 1' element 

20 fonctionnel et on d6finit un ordre de placement des 
blocs en partant d'un bloc d'origine et en parcourant 
tous les blocs de bloc voisin en bloc voisin, les 
places possibles pour les Elements fonctionnels d'un 
bloc ne comportant pas de place logique des 616ments 

25 fonctionnels des blocs places precedemment . 

6. Procede selon la revendication 1, dans 
lequel les elements fonctionnels sont des processeurs. 
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